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网 络 模拟 研究 概述 


IF 
WE: 本文 首 先 介绍 了 网 络 模拟 在 网 络 行为 研究 方面 的 重要 意义 以 及 目前 网 络 模拟 研究 工作 面临 的 难题 。 
然后 重点 介绍 了 网 络 模拟 研究 工作 中 最 重要 的 两 个 研究 方向 : 路 由 策略 和 流量 模型 抽象 技术 ， 分 别 介 绍 了 
其 研究 内 容 以 及 国内 外 最 新 研究 进展 。 最 后 总 结 并 展望 了 网 络 模拟 研究 工作 的 可 能 发 展 方向 。 


1 引言 


互联 网 作为 人 类 社会 信息 化 标志 ， 已 经 深入 到 社会 生活 的 各 个 领域 ， 成 为 极 具 战略 意义 
的 基础 设施 。 对 大 规模 网 络 环境 进行 研究 ,是 了 解 网 络 的 必然 过 程 ， 是 在 更 高 层次 上 保卫 互 
联网 稳定 良好 运行 的 基础 。 目 前 研究 互联 网 的 方法 主要 包括 数学 模型 分 析 、 网 络 测量 、 网 络 
模拟 、 网 络 仿 真 、 原 型 实验 平台 、 实 际 网 络 测试 等 中 。 文 献 [3] 分 析 了 各 种 方法 的 优 缺 点 ， 
指出 : 数学 模型 分 析 方 法 的 优点 是 灵活 并 且 成 本 低 , 但 有 可 能 会 由 于 建立 的 模型 过 于 简化 从 
而 导致 分 析 得 到 的 结果 不 正确 ; 网 络 测量 所 使 用 的 测量 方法 难以 做 到 十 全 十 美 , 会 导致 测量 
结果 不 正确 ; 实际 网 络 测试 由 于 实验 环境 不 可 控 ， 实验 不 可 重复 ， 同 时 存在 很 大 的 风险 ， 因 
此 很 少 被 采用 ; 原型 实验 平台 可 以 获得 更 实际 的 结果 ， 但 是 成 本 高 ， 运 用 不 便 ， 并 不 适用 于 
大 规模 网 络 行为 的 研究 , 同时 , 该 方法 的 实验 可 重复 性 差 ; 网 络 仿真 建立 的 模型 抽象 度 较 低 ， 
可 以 获得 较 高 的 真实 性 ， 但 所 能 研究 的 网 络 规模 小 ， 为 了 能 够 与 实际 网 络 交 互 ， 网 络 仿真 速 
度 必 须 达 到 实际 网 络 运 行 速度 ， 因 此 仿真 的 规模 受到 限制 。 


文献 [3] 还 指出 : 网 络 模拟 是 在 对 网 dd. 各 种 互联 网 研究 方法 比较 
络 的 行为 特征 进行 抽象 的 基础 上 建立 
简化 的 模型 (包括 协议 模型 、 流 量 模型 、 | 数学 模型 分 析 
拓扑 模型 等 )， 特 点 在 于 : 能 够 细致 地 | 网 络 测量 
刻画 网 络 运行 情况 ， 具 有 很 高 的 真实 上 | 网 络 模拟 
性 ; 能 够 研究 具有 上 万 节点 规模 的 网 | 网 络 仿真 
络 ， 可 对 较 大 规模 网 络 进行 研究 ， 模 拟 ”| 原型 实验 平台 


工具 本 身 使 用 方便 、 运 行 成 本 低 。 ep 


表 1 进行 了 6 种 互联 网 研究 方法 在 真实 性 、 规 模 、 成 本 等 方面 的 比较 。 可 以 看 出 ， 各 种 
方法 实际 上 是 这 三 个 方面 的 折衷 外。 
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由 于 网 络 模拟 成 本 较 低 ， 实 现 简单 。 。 表 2， 模 拟 方法 在 国际 顶级 会 议 上 的 应 用 比例 
AAT, RAINE, BET «4985-1989 2004 2004 


究 尚 未 实施 的 网 络 机 制 ， 并 能 保证 研究 所 

» EM SIGCOMM 13.896 50% 36.7% 
需 的 规模 ， 因 此 被 广泛 应 用 于 网 络 研究 的 : 
每 一 个 角落 一 一 业已 成 为 测试 网 络 协议 、 eo 10% 696  — 


分 析 网 络 行为 、 维 护 网 络 的 正常 运行 ， 以 
及 设计 网 络 架 构 、 评 价 新 型 网 络 机 制 的 主要 手段 。 文 献 [1] 对 网 络 研 究 领 域 的 顶级 会 议 
SIGCOMM 和 INFOCOM 中 的 文章 进行 统计 的 结果 CX 2 所 示 ) 表明 ， 模 拟 方法 已 成 为 
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种 互联 网 行为 研究 领域 广泛 应 用 的 基础 研究 工具 ， 被 广泛 应 用 于 互联 网 行为 研究 的 方 方 面 
面 一 一 协议 设计 与 分 析 验 网 证 、 络 安全 、 网 络 行为 预测 、 网 络 规划 建设 等 。 


2 “网络 模拟 研究 面临 的 问题 


鉴于 网 络 模拟 在 网 络 行为 研究 领域 的 重大 应 用 价值 ， 对 网 络 模拟 技术 本 身 的 研究 也 受到 
了 研究 者 的 广泛 关注 。 研 究 人 员 致 力 于 提高 网 络 模拟 工具 的 模拟 规模 、 模 拟 结果 的 真实 性 、 
降低 模拟 过 程 中 的 计算 开销 和 存储 开销 ， 以 进一步 降低 网 络 模拟 的 开发 和 运行 成 本 ,提高 应 
用 价值 。 

然而 ， 互 联网 与 生 俱 来 的 复杂 性 、 异 构 性 、 动 态 性 以 及 庞大 的 规模 都 给 网 络 模拟 研究 工 
作 带 来 了 巨大 挑战 。 首 先 ， 作 为 整个 网 络 体系 结构 核心 的 IP 协议 的 目的 是 无 颖 地 互 连 不 同 
的 网 络 技术 和 管理 域 。 它 对 用 户 提供 了 一 致 的 虚拟 连接 ， 使 用 户 不 必 关 心 网 络 连 通 的 细 贡 。 
但 网 络 的 复杂 性 并 非 就 此 消失 , 底层 网 络 大 量 不 一 致 的 行为 ,导致 我 们 对 网 络 分 析 和 对 其 行 
为 的 理解 存在 着 一 定 的 困难 。 


其 次 , 网 络 的 变化 非常 快 。 这 包括 两 方面 : 一 是 网 络 异 构 性 和 动态 特性 ， 如 拓扑 的 变化 、 
链 路 的 多 样 、 路 由 的 动态 特性 、 协 议 的 复杂 性 等 ， 使 得 对 网 络 的 建 模 和 模拟 变 得 十 分 困难 。 
二 是 网 络 的 应 用 发 生变 化 ， 导 致 了 流量 模式 的 变化 : 从 早期 的 电子 邮件 (Email)， 文 件 传输 
(FTP)， 到 现在 的 万 维 网 服务 (WWW)， 多 媒体 流 等 。 另 外 ， 网 络 应 用 存在 “灾难 式 成 功 ” 
(Success Disaster) 现象 ， 即 一 种 应 用 或 协议 可 能 在 设计 和 实现 方法 还 没有 完善 就 在 网 络 上 
广泛 地 应 用 了 〔 如 HTTP)， 这 也 增加 了 网 络 模 拟 的 困难 。 


最 后 ， 现 今 网 络 规模 巨大 。 这 又 带 来 了 两 个 问题 : 一 是 网 络 主机 数目 的 增长 异常 迅速 ， 
近年 来 互联 网 主机 数 保持 了 高 增长 速度 ,互联 网 数据 量 则 几乎 保持 了 指数 增长 。 对 如 此 大 量 
的 网 络 对 象 进行 模拟 无 疑 是 非常 困难 的 ; 二 是 网 络 的 扩展 性 。 有 的 网 络 协议 和 机 制 在 小 规模 
的 网 络 上 运行 良好 ， 但 当 网 络 规模 扩展 到 一 定 程度 时 就 变 得 低 效 甚至 不 可 用 。 


互联 网 的 这 些 特点 给 网 络 模拟 研究 工作 带 来 了 模拟 规模 、 模 拟 效率 ， 以 及 模拟 真实 性 等 
方面 的 困难 。 


从 性 能 角度 来 说 ， 网 络 模拟 器 面临 着 两 个 难题 一 一 模拟 规模 和 模拟 效率 。 随 着 互联 网 的 
迅猛 发 展 ， 网 络 的 规模 越 来 越 大 ， 对 互联 网 模拟 的 要 求 越 来 越 高 ， 男 一 方面 ， 由 于 硬件 资源 
尤其 是 内 存 资源 的 限制 ,网 络 模拟 器 所 能 够 模拟 的 网 络 规模 有 限 , 无 法 适应 互联 网 模拟 的 要 
求 ; 而 网 络 规模 的 不 断 增 大 和 网 络 行为 的 日 益 复杂 多 样 ,模拟 性 能 低下 也 成 为 限制 网 络 模拟 
器 实际 应 用 的 瓶颈 之 一 。 根 据 文献 [7] 中 的 估算 结果 ， 对 于 一 个 1X10 个 节点 规模 的 网 络 来 
说 ， 传 统 的 数据 包 级 离散 事件 模拟 器 〈 如 NS-2) 需要 模拟 的 事件 数 约 为 2.9X102， 以 每 秒 
处 理 1,000,000 个 事件 的 处 理 能 力 ， 模 拟 网 络 一 秒 钟 的 运行 需要 模拟 器 运行 时 间 约 为 4 天; 
保存 模拟 过 程 所 必需 的 节点 、 链 路 、 数 据 包 等 信息 所 需要 的 内 存 空间 约 为 2.9X10“B ( 约 
3TBO; 如 果 需 要 对 网 络 行为 模拟 过 程 进 行 记录 ， 保 存 1 秒 钟 的 网 络 行为 所 需要 的 存储 空间 
约 为 1.4X10B。 截 至 目前 ,根据 相关 资料 和 文献 ， 已 知 的 大 规模 网 络 模拟 器 只 能 够 模拟 最 
大 10" 量 级 的 节点 规模 ， 而 且 以 拓扑 连接 关系 和 所 模拟 的 应 用 均 极 为 简单 为 前 提 。 


从 功能 角度 来 说 ， 网 络 模拟 器 应 该 能 够 足够 真实 地 模拟 出 所 要 模拟 的 网 络 拓扑 上 的 各 种 
网 络 行为 。 比 如 各 种 协议 ， 安 全 事件 等 ， 以 满足 对 网 络 行为 进行 分 析 研 究 的 应 用 需求 。 

从 模拟 真实 性 角度 来 说 ， 互 联网 的 异 构 性 和 动态 性 对 网 络 模拟 的 真实 性 提出 了 巨大 挑 
战 。 如 何 才能 够 抓 住 互联 网 的 核心 的 、 不 变 的 特征 ， 忽 略 次 要 属性 ， 以 建立 正确 的 互联 网 模 
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拟 模型 也 是 网 络 模拟 技术 的 关键 。 
3 ”国内 外 主要 研究 团队 和 项 目 


国外 网 络 模拟 技术 的 研究 工作 开始 于 二 十 世纪 九 十 年 代 , 目前 具有 代表 性 的 科研 组 织 机 
构 和 项 目 主要 包括 : 


(1) 由 南 加 州 大 学 /信息 科学 研究 所 CUniversity of South California/Information Science 
Institute, USC/ISI)、 施 乐 由 克 研 究 中 心 (Xerox PARC)、 劳 伦 斯 伯克利 国家 实验 室 
CLBNL ) 和 加 州 大 学 伯克利 分 校 等 美国 大 学 和 实验 室 合作 ， 由 美国 国防 部 高 等 
究 计 划 局 CDARPAO 资助 的 VINT(Virtual InterNet Tested) 项 目 名。 网 络 模拟 研究 领 
域 最 著名 的 NS-2 中 即 出 自 该 项 目 


(2) 美国 伊利 诺 大 学 香槟 分 校 (UIUC) 的 戴 维 . 尼克 尔 (David Nicol) 教授 主持 的 安全 
和 系统 建 模 (MOUSE) 课题 组 ， 是 网 络 模拟 方面 的 领军 团队 ， 开 发 了 iSSF 模拟 
器 (中 ， 在 网 络 安全 行为 建 模 和 模拟 、 网 络 流量 建 模 、 实 时 互联 网 行为 模拟 等 方 盏 
研究 成 果 卓 著 ; 


(3) ”佐治 亚 理 工学 院 (GaTech) 的 了 藤本 (Fujimoto) 和 瑞 利 (Riley) 教授 领导 的 团队 ， 

FET PDNS" sr GTNetSt*I 并 行 网 络 模拟 器 。 在 网络 模拟 路 由 策略 和 模拟 并 行 化 
技术 方面 研究 深入 。 

(4) ”佛罗里达 国际 大 学 (FIU) WER. CFE, Jason Liu) 领导 的 课题 组 ,是 上 文 (2) 
中 所 提 项 目的 一 个 分 支 ， 但 在 流量 模型 抽象 方面 研究 十 分 深入 ， 目 前 已 成 为 该 方 
向 的 顶尖 研究 力量 。 


(5 “天 国 电子 通信 研究 院 CETRD WERE CA, Young Sun Kim) 领导 的 网 络 丰 
究 项 目 组 采用 SSFNet 模拟 器 对 互联 网 进行 深入 研究 ， 并 在 多 个 国际 会 议 、 期 刊 上 
发 表 文章 中 1。 


(6) “台湾 国立 交通 大 学 的 王 协 源 (Shie-Yuan Wang) 在 2003 年 开发 了 NCTUns!"“!, ix 
模拟 器 采用 对 实际 网 络 流量 的 抽样 作为 模拟 输入 ， 上 有 具有 极 高 的 真实 性 ， 连 续 在 国 
际 顶级 会 议 Mobicom, Infocom 发 表 文 章 及 受 邀 进行 演示 0 。 


国内 网 络 模拟 方向 研究 起 步 较 晚 ， 研 究 基 础 相对 比较 薄弱 。 从 公开 发 表 的 文献 来 看 ， 研 
究 力 量 主要 来 自 中 科 院 计算 所 、 哈 尔 滨 工业 大 学 、 西 安 交 通 大 学 等 科研 机 构 。 他 们 的 工作 都 
是 从 引入 国外 经 典 模拟 器 CNS-20 和 模拟 技术 开始 ， 逐 步 深 入 地 开发 和 形成 各 自 的 研究 兴 
趣 和 方向 ， 并 且 于 近 几 年 来 取得 了 长 足 的 进步 ,在 路 由 策略 、 并 行 化 技术 等 方面 达到 了 国际 
水 平 。 


4 ”关键 技术 研究 现状 


提升 网 络 模拟 规模 和 性 能 的 技术 手段 有 很 多 ， 包 括 各 类 模型 (拓扑 模型 、 协 议 模型 、 流 
量 模型 、 应 用 模型 ) 的 抽象 技术 ， 并 行 化 技术 ， 调 度 机 制 等 。 其 中 ， 各 类 模型 的 抽象 技术 是 
网 络 模拟 技术 的 关键 押 在 。 事 实 上 ， 模 拟 技术 的 本 质 就 是 对 所 模拟 事物 进行 合理 抽象 ， 以 准 
外 地 表述 模拟 对 象 。 


在 网 络 模拟 技术 所 需 的 各 类 模型 中 ， 路 由 模型 和 流量 模型 是 最 为 关键 的 两 
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究 人 员 关注 度 最 高 的 。 这 是 因为 : (1) 数据 包 的 路 由 技术 是 互联 网 上 各 类 应 用 的 基础 ， 而 路 
由 信息 的 计算 、 存 储 和 查找 方法 , 对 于 网 络 模拟 工具 的 计算 开销 和 存储 开销 都 具有 极 大 的 影 
Wj; (2) 网 络 行为 通 第 的 表现 就 是 各 种 应 用 的 数据 包 在 互联 网 上 的 不 断 传 输 ， 而 正 是 这 些 数 
据 流量 给 网 络 模拟 器 带 来 了 极 大 的 模拟 事件 数量 , 也 就 意味 着 巨大 的 计算 和 存储 开销 。 下 面 
将 分 别 介绍 这 两 方面 上 共有 代表 性 的 研究 成 果 。 


4.1 路 由 抽象 技术 相关 研究 
4.1.1 研究 内 容 


随 着 网 络 模拟 规模 需求 的 不 断 扩 大 ， 路 由 抽象 技术 成 为 了 网 络 模拟 研究 的 关键 问题 之 
一 。 互 联网 由 18,000 以 上 的 自治 系统 (Autonomous System， AS) 组 成 ， 每 个 自治 系统 通 
常会 包含 上 百 个 负责 自治 系统 间 路 由 通讯 的 路 由 器 节点 , 以 及 上 千 个 负责 自治 系统 内 部 路 由 
的 路 由 器 节点 。 随 着 网 络 规模 的 不 断 增长 ， 一 个 互联 网 服务 提供 商 〈ISP) 核心 路 由 器 节点 
上 的 路 由 表 的 规模 就 达到 了 足以 耗 尽 路 由 器 内 存 空 间 的 地 步 。 可 想 而 知 ， 当 需要 保存 所 有 这 
些 路 由 器 节点 的 全 部 路 由 信息 ,以 完成 互联 网 的 行为 模拟 时 , 会 对 模拟 器 的 存储 空间 提出 多 


一 和 严峻 的 考验 。 而 在 如 此 庞大 的 路 由 状态 信息 数据 中 , 计算 和 查找 模拟 应 用 所 需要 的 路 由 信 
^ 息 也 将 对 处 理 器 计算 资源 提出 巨大 挑战 。 

= 同时 ， 路 由 模拟 的 真实 性 也 是 研究 的 重点 内 容 之 一 。 如 果 路 由 模拟 与 实际 网 络 环境 中 的 
e 路 由 过 程 差异 很 大 ， 则 对 网 络 行为 模拟 过 程 产生 的 流量 、 拥 塞 、 丢 包 等 模拟 结果 都 将 失去 意 
e 义 ， 从 而 严重 影响 网 络 行为 模拟 的 可 信 性 。 研究 具 有 高 性 能 、 高 真实 性 的 网 络 模拟 路 由 抽象 
eo 技术 ， 是 网 络 模拟 研究 领域 的 关注 热点 之 一 。 

Q 

`~ 4.1.2 相关 研究 进展 


根据 模拟 器 对 动态 路 由 是 否 存在 需求 ， 路 由 抽象 技术 可 以 分 为 静态 路 由 模拟 技术 和 动态 
路 由 模拟 技术 。 前 者 是 针对 静态 路 由 的 处 理 , 即 在 假设 拓扑 信息 在 全 部 模拟 过 程 中 是 不 变 的 
前 提 下 , 研究 如 何 完成 单个 模拟 节点 上 以 及 各 个 模拟 节点 之 间 的 路 由 计算 , 存储 和 查找 策略 。 
而 后 者 是 针对 网 络 拓扑 结构 的 动态 性 , 研究 如 何 真 实地 模拟 拓扑 信息 变化 带 来 的 路 由 信息 的 
变化 。 下 面 将 分 别 介绍 这 两 方面 的 相关 研究 进展 。 


(1) ”静态 路 由 模拟 技术 


静态 路 由 模拟 技术 是 目前 的 研究 工作 重点 。 针 对 本 地 静态 路 由 策略 研究 ， 当 前 模拟 器 大 
多 采用 集中 计算 并 存储 全 局 静态 路 由 表 的 路 由 策略 (Flat 策略 )。 该 方法 在 模拟 器 初始 化 过 
程 中 根据 全 局 拓扑 连接 关系 计算 全 局 路 由 表 , 并 将 其 保存 在 内 存 中 。 在 模拟 数据 包 的 路 由 过 
程 时 查找 静态 路 由 表 ， 进 行 数据 包 的 路 由 。 该 方法 由 于 需要 保存 静态 路 由 表 ， 存储 空间 需求 
很 大 。 对 节点 规模 为 n 的 网 络 拓扑 来 说 ， 空 间 复杂 度 为 O(n”); 而 在 查找 路 由 时 ， 根 据 源 ， 
目的 节点 地 址 信息 ， 在 OQ 时 间 内 即 可 得 到 所 需 路 由 信息 ， 路 由 查找 时 间 最 小 。 


36 CVE, Huang) 等 在 文献 [18] 中 提出 了 一 种 近似 路 由 的 计算 和 查找 策略 ， 用 一 棵 最 
小 生成 树 作 为 路 由 表 , 认为 所 有 的 路 由 信息 都 保存 在 这 棵 最 小 生成 树 上 。 该 方法 路 由 表 所 占 
用 空间 为 O(n) ， 而 查找 时 间 复 杂 度 为 O(In(n)) ， 在 存储 空间 和 查找 时 间 的 平衡 上 效果 很 好 ; 
但 由 于 一 棵 最 小 生成 树 所 能 履 盖 的 最 短路 径 有 限 ， 因 此 只 是 一 种 近似 路 由 策略 。 

EAR CHiromori) 等 在 文献 [19] 中 提出 了 由 一 棵 最 小 生成 树 结合 一 张 部 分 静态 路 由 表 来 
保存 路 由 信息 的 方法 〈 称 为 STree_Flat 方法 )。 该 方法 采用 一 棵 最 小 生成 树 来 保存 部 分 路 
信息 ， 而 对 不 能 被 该 树 包含 的 最 短路 径路 由 信息 则 保存 在 一 张 静 态 路 由 表 中 。 在 查找 路 由 时 
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首先 查找 静态 路 由 表 ， 找 到 则 使 用 该 路 由 信息 进行 路 由 ， 否 则 就 在 最 小 生成 树 上 查找 。 
STree_Flat 方 法 的 时 间 和 空间 复杂 度 视 最 小 生成 树 能 够 覆盖 的 最 短路 径路 由 信息 数量 一 一 即 
最 小 生成 树 的 最 短路 径 履 盖 率 (coverage percentage) 一 一 而 定 。 假 设 最 小 生成 树 的 最 短路 径 
HKH p> I STree Flat 方法 所 需 内 存 空 间 为 Onm+(- 丰 xm); 但 在 查找 静态 路 由 表 时 ， 
必须 遍历 静态 路 由 表 , 因而 其 最 坏 查 找 时 间 为 OUn(D+(- p) x n^) 。 该 方法 在 保证 查询 路 
言 县 准确 的 前 提 下 节省 了 大 量 空 间 ,， 但 由 于 部 分 路 由 表 的 遍历 时 间 复 杂 度 很 高 ,查找 时 间 的 
关 增 ， 综 合 效果 较 差 。 


Bk CAE, Chen) 等 在 文献 [20] 中 提出 了 以 多 棵 最 小 生成 树 结合 一 张 静 态 路 由 表 来 保存 
路 由 信息 的 方法 〈 称 为 MTree_Flat 方法 )。 采 用 多 棵 最 小 生成 树 来 保存 路 由 信息 ， 从 而 提高 
了 生成 树 的 最 短路 径 窗 盖 率 ,进一步 节省 存储 空间 。 在 查找 路 由 时 ,仍然 是 先 查 找 静 态 路 由 
表 部 分 ， 若 找到 则 直接 进行 路 由 ， 和 否则 就 说 明 该 路 径 被 某 一 棵 最 小 生成 树 履 盖 ， 于 是 逐 棵 碍 
找 最 小 生成 树 上 的 路 由 信息 ， 选 择 其 中 最 短 的 路 径 作 为 路 由 信息 返回 ， 供 数据 包 路 由 使 用 。 


该 方法 的 时 间 和 空间 复杂 度 仍然 由 最 小 生成 树 的 覆盖 率 决 定 。 假 设 使 用 了 K 棵 最 小 生成 树 ， 
覆盖 率 为 p ， 则 其 空间 复杂 度 为 O(kn+0-p)xn?) 。 而 查找 路 由 所 需 时 间 最 坏 为 

p O(kxln(n)-(1- p)xn?) 。 由 于 采用 了 多 棵 生成 树 ， 最 短路 径 覆 盖 率 必然 比 相 同 拓扑 条 件 下 
= 的 一 棵 最 小 生成 树 大 得 多 ， 因 此 更 加 节省 存储 空间 。 在 查找 时 虽然 需要 查找 全 部 K 棵 生成 树 
ed 以 选择 路 径 最 短 的 路 由 ， 但 是 由 于 覆盖 率 高 ， 静 态 路 由 表 规 模 较 小 ， 查 找 静 态 路 由 表 所 需 时 
© 间 也 更 少 ， 因 此 综合 效果 比 STree_Flat 方法 更 优 。 

» 除了 上 述 预 先 计算 并 静态 存储 路 由 信息 的 方法 以 外 ， 还 有 一 种 不 保存 任何 路 由 信息 ， 而 
c 是 在 模拟 过 程 中 实时 计算 的 路 由 策略 。 瑞 利 等 提出 的 Nix- Vector 方法 2423 就 是 其 中 的 代表 。 
N 该 方法 在 模拟 初始 化 过 程 中 不 进行 任何 的 路 由 信息 计算 和 存储 工作 ， 而 是 在 数据 包 生 成 时 ， 
民 据 源 和 目的 地 址 信息 实时 计算 路 由 , 并 将 计算 出 的 路 由 信息 保存 在 数据 包头 中 , 在 数据 包 


传输 过 程 中 经 过 每 一 个 路 由 器 节点 时 ,根据 数据 包头 携带 的 信息 解析 出 该 数据 包 的 路 由 。 该 
方法 不 需要 任何 额外 的 存储 空间 来 保存 路 由 信息 , 空间 复杂 度 最 小 。 但 每 次 模拟 一 个 新 的 数 
据 包 传输 过 程 都 需要 裔 历 全 局 拓扑 以 计算 路 由 , 其 时 间 复 杂 度 很 大 ,以 邻接 表 方 式 描述 的 拓 
扑 结 构 ， 查 找 时 间 复 杂 度 为 O(n+e) ， 其 中 e 为 边 的 数目 。 该 方法 能 够 有 效 地 处 理 拓扑 变化 
= 导致 的 路 由 变化 ， 也 提出 了 计算 不 同 节点 感知 拓扑 变化 时 间 的 方法 ， 但 由 于 计算 和 验证 


c Nix-Vector 向 量 引 入 了 大 量 的 额外 事件 和 计算 量 ， 同 时 采用 Nix- Vector 策略 进行 路 由 计算 本 
o 身 就 需要 消耗 大 量 的 处 理 器 计算 时 间 , 因此 其 模拟 效率 很 低 , TU ERR P EO al S B2 T 


模拟 网 络 的 规模 增 大 而 进一步 放大 。 


基于 以 上 路 由 策略 研究 的 思想 综合 考虑 ， 我 们 在 前 期 的 研究 工作 中 提出 了 多 树 - 邻 索引 
向 量 技术 (MTree_Nix)” *4!, MTree Nix 技术 采用 多 棵 最 小 生成 树 和 Nix-Vector 技术 相 结 合 
的 方法 ， 在 路 由 模拟 技术 的 存储 开销 和 计算 开销 之 间 达 到 了 最 优 的 平衡 。 


(2) ”动态 路 由 模拟 技术 


互联 网 的 动态 性 是 互联 网 的 基本 属性 之 一 。 互 联网 上 时 刻 可 能 发 生 的 拓扑 结构 变化 都 会 
导致 路 由 状态 的 动态 更 新 。 真实 地 反映 互联 网 行为 属性 , 就 需要 更 真实 的 模拟 路 由 状态 信息 
的 动态 变化 过 程 。 这 就 是 动态 路 由 抽象 模拟 技术 的 研究 内 容 。 动态 路 由 模拟 技术 的 研究 方法 
主要 包括 两 种 ， 动 态 路 由 协议 模拟 以 及 静态 路 由 表 重 构 。 

动态 路 由 协议 模拟 的 研究 工作 主要 是 针对 边界 网 关 协 议 (Border Gateway Protocol, 
BGP) 和 开放 式 最 短路 径 优 先 (Open Shortest Path First, OSPF) 等 动态 路 由 协议 的 模拟 ， 
研究 工作 相对 较 多 号 并。 但 这 些 工 作 的 主要 目标 是 对 协议 本 身 的 研究 ， 并 不 适用 于 作为 网 络 
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网 络 模拟 研究 概述 


模拟 器 的 基础 路 由 模块 来 使 用 。 


对 路 由 表 的 重 构 是 处 理 动态 路 由 模拟 的 一 种 简单 而 有 效 的 思路 。 对 所 有 的 静态 路 由 策 
算法 都 可 以 在 发 生 了 拓扑 连接 关系 变化 时 进行 路 由 表 的 重 构 , 但 由 于 采用 的 是 集中 存放 的 路 
由 表 ， 因 此 当 拓扑 变化 发 生 以 后 ， 路 由 表 的 更 新 对 所 有 节点 来 说 都 是 同时 完成 的 ， 这 就 严重 
损害 了 模拟 的 真实 性 。 为 解决 这 一 问题 ， 瑞 利 等 提出 了 一 种 动态 路 由 模拟 的 方法 ,在 拓扑 信 
县 变化 时 对 保存 在 缓存 中 的 Nix 向 量 进行 验证 ， 以 确定 其 是 否 还 能 够 满足 最 短路 径 的 要 
求 台 。 该 方法 能 够 有 效 地 处 理 拓扑 变化 导致 的 路 由 变化 ， 也 提出 了 计算 不 同 节 点 感知 拓扑 
变化 时 间 的 方法 。 但 由 于 计算 和 验证 Nix-Vector 向 量 引 入 了 大 量 的 额外 事件 和 计算 量 , 同时 
用 Nix-Vector 策略 进行 路 由 计算 本 身 就 需要 消耗 大 量 的 处 理 器 计算 时 间 , 因此 其 模拟 效率 
Ko 而 且 效 率 低下 的 问题 会 随 着 所 模拟 网 络 的 规模 增 大 而 进一步 放大 。 本 课题 组 在 文献 [29] 
工作 的 基础 上 ， 完 善 了 拓扑 变化 信息 更 新 时 间 的 计算 模型 ， 并 基于 MTree Nix 技术 提出 了 
基于 拓扑 变化 信息 更 新 时 间 计 算 模型 的 动态 MTree Nix 技术 中， 进一步 降低 了 动态 路 由 模 
拟 技术 的 计算 开销 和 存储 开销 ， 是 已 公开 发 表 的 最 优化 动态 路 由 模拟 技术 。 


ma 7H 


u 3) ”小 结 

之 从 路 由 抽象 模拟 技术 的 研究 现状 来 看 ， 问 题 主要 存在 于 动态 路 由 模拟 技术 上 。 一 方面 ， 
c 拓扑 和 路 由 的 动态 变化 作为 互联 网 的 一 个 重要 属性 ， 为 模拟 动态 路 由 提出 了 极为 迫切 的 需 
N R: 另 一 方面 , 动态 变化 的 拓扑 和 路 由 信息 带 给 模拟 器 的 是 急剧 增加 的 计算 和 存储 开销 ， 使 
S 得 本 就 效率 较 低 的 网 络 模拟 器 面临 更 加 严重 的 计算 资源 和 存储 资源 竞争 , 更 难以 满足 实时 模 
as 拟 的 应 用 需求 。 根 据 最 新 实验 结果 ， 在 采用 文献 [30] 中 的 动态 MTree Nix 技术 的 网 络 模拟 系 
e 统 ,模拟 类 似 蠕虫 扩散 这 样 的 大 规模 网 络 安全 事件 时 ， 其 模拟 效率 仅 为 采用 静态 路 由 模拟 技 
N 术 时 的 约 1120， 更 谈 不 上 满足 实时 模拟 的 需求 。 因 此 ， 研 究 如 何 降低 动态 路 由 模拟 技术 的 计 
算 开 销 和 存储 开销 ， 以 提高 模拟 性 能 ， 是 路 由 抽象 模拟 技术 研究 的 当务之急 ， 也 是 影响 网 络 


模拟 性 能 的 重要 因素 。 
4.2 流量 模型 抽象 技术 相关 研究 
4.2.1 研究 内 容 


互联 网 上 的 网 络 流量 由 一 个 个 数据 包 组 成 。 对 于 离散 事件 模拟 器 来 说 ， 为 了 能 够 准确 地 
述 网 络 行 为 ,需要 对 每 一 个 数据 包 的 每 一 次 行为 (比如 数据 包 在 连接 上 的 入 队 和 出 队 、 数 
据 包 被 路 由 器 和 终端 节点 的 处 理 等 ) 都 作为 一 个 事件 来 进行 模拟 ， 这 就 是 所 谓 包 级 别 
(packet-level) 的 模拟 。 目 前 包括 NS-2 在 内 的 很 多 网 络 模拟 器 都 采用 的 是 基于 包 级 别 的 模 
JA. 虽然 包 级 别 的 模拟 能 够 保证 较 高 的 真实 性 , 但 是 由 于 每 一 个 数据 包 的 每 一 次 行为 都 需要 
I 单独 的 事件 来 描述 ， 这 对 于 网 络 模拟 器 的 计算 开销 来 说 是 极 大 的 挑战 。 为 降低 计算 开销 ， 
需要 对 单个 数据 包 以 及 由 单一 数据 包 组 成 的 网 络 流量 模型 进行 简化 , 这 就 是 流量 模型 抽象 技 
术 所 要 研究 的 内 容 。 


4.2.2 相关 研究 进展 


针对 流量 模型 抽象 技术 ， 目 前 多 数 研 究 采 用 的 是 提高 流量 模型 抽象 粒度 的 方法 ， 即 采用 
所 谓 “ 流 模拟 (fluid-level)” 方 式 。 该 方法 将 具有 某 些 相同 属性 〈 如 源 、 目 的 地 址 等 ) 的 数 
据 包 抽 象 为 一 个 流 ， 使 用 关于 模拟 时 间 的 分 段 函数 来 表示 流 的 关键 属性 〈 如 丢 包 率 、 队 列 长 
度 等 )， 在 模拟 过 程 中 根据 需要 更 新 这 些 属 性 的 值 ， 以 此 来 描述 网 络 特征 。 通 过 这 种 流 模拟 
方式 ， 可 以 有 效 地 降低 单位 时 间 内 模拟 器 需要 处 理 的 事件 数量 ， 从 而 提高 模拟 效率 。 根 据 流 
模拟 模型 的 调度 机 制 不 同 , 目前 的 研究 主要 分 为 两 类 : 基于 流 的 事件 驱动 模拟 方法 以 及 基于 
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信息 技术 快报 Vol.9 No.3 
Information Technology Letter May 2011 


基于 流 的 事件 驱动 模拟 方法 是 当 某 个 数据 流 大 小 需要 变化 时 〈 比 如 多 个 数据 流 汇聚 在 同 


一 条 链 路 上 产生 著 加 )， 就 产生 一 个 离散 事件 ， 用 以 触发 此 数据 流 相关 属性 的 变化 。 代 表 性 
研究 工作 包括 文献 [31-33] 等 。 在 数据 流 变 化 不 剧烈 的 时 候 , 这 种 方法 能 够 有 效 减 少 模拟 所 需 


处 理 的 离散 事件 数 


目 ， 降 低 计 算 开 销 ; 但 在 数据 流 变化 比较 剧烈 的 情况 下 ， 此 方法 性 能 受 损 
严重 , 且 易 引发 波及 效应 Cripple effect), 甚至 导致 需 处 理 的 事件 数 超过 数据 包 级 的 模拟 中 |]。 


SEP REA Tag 


K 动 模拟 方法 是 在 模拟 过 程 中 ， 模 拟 时 间 周 期 性 的 向 前 推进 ， 每 次 推进 一 


定 大 小 的 时 间 间 隔 (time-step )。 每 推进 一 个 时 间 间 隔 ， 就 产生 一 个 离散 事件 。 该 事件 会 完 
C1) 依靠 流量 模型 产生 新 的 数据 流 大 小 ;(2) 根据 新 产生 的 数据 流 大 小 以 


成 如 下 三 步 操 作 : 


及 前 一 时 间 周期 内 网 络 的 状态 , 计算 下 一 周期 开始 时 的 网 络 状态 ，(3) 计算 网 络 状态 对 流量 
模型 的 反馈 并 修改 流量 模型 的 参数 。 代 表 性 工作 包括 文献 [34-36] 等 。 基 于 流 的 时 间 了 驱动 模拟 
方法 与 基于 流 的 事件 驱动 模拟 相 比 在 模拟 效率 上 具有 较 大 优势 , 同时 在 模拟 真实 性 上 相应 的 


有 一 定 损失 。 


另外 ， 针 对 数据 包 级 和 流 级 模拟 的 各 自 优 和 缺点， 研究 人 员 又 提出 了 将 二 者 有 机 地 结合 起 


来 ， 根 据 不 同 应 用 需求 ， 采 用 两 者 相 结合 的 混合 模拟 〈hybrid simulation) 技术 进行 不 同 精 
度 的 网 络 行为 模拟 。 例 如 采用 基于 流 的 模拟 技术 来 模拟 背景 流量 ， 而 对 于 关注 度 较 高 的 前 景 


流量 则 采用 包 级 别 的 模拟 技术 进行 模拟 。 代 表 


aon 


生 工作 包括 文献 [37-40] 等 。 


从 流量 模型 抽象 技术 的 研究 现状 来 看 ， 数 据 包 级 一 流 级 流量 模型 混合 模拟 因 其 模拟 效率 


和 真实 性 的 高 效 结合 而 日 益 成 为 研究 发 展 的 趋势 。 但 目前 的 研究 成 果 仍 然 存在 着 较 大 的 问 
题 ， 主 要 体现 如 下 : 首先 ， 基于 流 的 模拟 技术 的 两 种 方法 各 有 优点 , 但 又 都 存在 难以 解决 的 
问题 。 基于 流 的 事件 驱动 模拟 方法 很 难 消除 波及 效应 带 来 的 危害 , 在 最 新 的 研究 工作 中 基本 


已 被 放弃 ; 基于 流 日 
展 趋势 ， 但 在 模拟 真实 性 方 


缺乏 有 效 的 解决 方 


时间 驱动 模拟 方法 在 计算 性 能 方面 优势 较 大 ,是 流量 模型 抽象 技术 的 发 


存在 先天 缺陷 ， 并 且 在 时 间 步 长 (time step) 选取 策略 上 目前 


案 。 其 次 , 在 混合 模拟 技术 中 ， 数 据 包 级 流量 和 流 级 流量 的 交互 技术 是 难 
点 所 在 , 而 目前 绝 大 多 数 研究 中 采用 的 基于 流 的 时 间 驱 动 模拟 方法 , 在 与 数据 包 级 的 流量 交 


互 时 都 是 将 数据 包 级 的 流量 进行 遍 平 化 处 理 后 纳入 到 基于 流 的 时 间 驱 动 模型 中 , 在 每 个 时 间 


模拟 。 


4.3 我 们 的 研究 工作 


步 长 的 终点 参与 流量 模型 的 更 新 计算 , 这 就 很 难保 证 用 户 关 注 的 单个 数据 包 属 性 能 够 被 精确 


近年 来 中 科 院 计算 所 信息 安全 研究 中 心 一 直 致 力 于 网 络 模拟 技术 方面 的 研究 ， 已 经 积累 
了 深厚 的 技术 储备 。 中 心 骨干 研究 人 员 近 年 来 作为 核心 成 员 先 后 参与 了 多 项 网 络 行为 模拟 相 
关 的 国家 级 重点 项 目 ， 主 要 包括 : OD 国家 973 计划 项 目 “ 虚 拟 计算 环境 实验 床 与 仿真 平 
&". CD 国家 863-917 专项 “分 布 式 网 络 模拟 技术 ” (3) 国家 863 计划 重点 项 目 “ 高 性 能 


大 规模 网 络 行为 模拟 系统 ”。 针 对 该 领域 已 发 表 10 余 篇 高 水 平 学 术 论文 ， 在 路 由 抽象 技术 、 


模拟 并 行 化 技术 、 流 量 模型 


方法 和 实用 工具 。 


] 象 技术 等 方面 进行 了 深入 研究 ， 积 累 了 大 量 的 特色 技术 、 研 究 


基于 以 上 工作 积累 ， 课 题 组 于 2010 年 申请 到 流量 模型 抽象 技术 相关 的 国家 自然 基金 项 


目 “ 基 于 抽象 流量 模型 的 高 性 能 网 络 模拟 技术 研究 ”。 该 项 目 针 对 4.2 节 中 介绍 的 当前 流量 


模型 抽象 技术 研究 工作 的 缺点 ， 研 究 上 共有 更 高 模拟 性 能 和 模拟 真实 性 的 流量 模型 抽象 技术 。 


ELE C 


网 络 模拟 研究 概述 


H ATZI H 


研究 工作 正在 进展 中 。 


5 总 结 


网 络 模拟 作为 研究 互联 网 行为 属性 的 有 效 基 础 工具 ， 日 益 受到 科研 工作 者 的 重视 。 对 网 
络 模拟 的 研究 也 成 为 目前 的 研究 热点 之 一 。 本 文 从 网 络 模拟 研究 的 两 个 重要 方向 : 路 由 策略 
和 流量 模型 抽象 进行 了 深入 介绍 ,分 析 了 当前 研究 工作 的 进展 情况 ,存在 的 主要 问题 以 及 可 


展望 未 来 的 网 络 模拟 研究 发 展 ， 除 了 本 文 详细 介绍 的 路 由 策略 和 流量 模型 抽象 技术 以 


外 ， 网 络 模拟 的 并 行 化 技术 、 协 议 模 型 抽象 技术 等 也 将 成 为 研究 的 热点 方向 。 另 外 ， 随 着 计 


算 和 存储 资源 性 能 的 日 益 提 升 , 基于 虚拟 化 技术 的 


成 具有 多 层次 抽象 粒度 , 兼 具 高 性 能 与 高 真实 性 的 


= 
> 


4 络 仿真 技术 与 网 络 模拟 技术 相 结合 ,， 形 
4 络 实时 模拟 一 仿真 环境 ， 也 将 称 为 未 来 


ii 


网 络 行为 研究 工具 的 发 展 方向 。 
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